苏州大学突破AI数学推理瓶颈:让小模型也能精准找到错误步骤
这项由苏州大学计算机科学与技术学院的丁宇阳、史鑫宇、李俊涛、梁晓波、张民等研究者,以及腾讯公司的涂兆鹏共同完成的研究,发表于2025年第39届神经信息处理系统会议(NeurIPS 2025)。有兴趣深入了解的读者可以通过论文编号arXiv:2509.16548
这项由苏州大学计算机科学与技术学院的丁宇阳、史鑫宇、李俊涛、梁晓波、张民等研究者,以及腾讯公司的涂兆鹏共同完成的研究,发表于2025年第39届神经信息处理系统会议(NeurIPS 2025)。有兴趣深入了解的读者可以通过论文编号arXiv:2509.16548
当我们解决数学题时,如果第一遍算错了,通常会回头重新审题,仔细观察图表中的细节。但目前的人工智能视觉模型却做不到这一点——它们看图就像"一目十行"的快速阅读,看一眼就下结论,很少会重新审视图像中的关键信息。
当我们解决数学题时,如果第一遍算错了,通常会回头重新审题,仔细观察图表中的细节。但目前的人工智能视觉模型却做不到这一点——它们看图就像"一目十行"的快速阅读,看一眼就下结论,很少会重新审视图像中的关键信息。
这项由Meta AI团队(包括来自卡内基梅隆大学的研究者)开展的研究发表于2025年9月,论文题为《多数未必正确:用强化学习训练解决方案聚合》。感兴趣的读者可以通过arXiv:2509.06870v1获取完整论文。研究团队包括赵文婷、普兰贾尔·阿加瓦尔、萨瓦纳
黄仁勋的2小时重磅访谈于本周发布!本次对谈信息密度格外高,黄仁勋集中表达了对英伟达近期包括对OpenAI的千亿美元投资、投资英特尔等一系列大动作的原因,对英伟达的产业角色的定位,对AI产业的发展前的前瞻,以及AI对世界经济格局的彻底重构。
2025年9月,谷歌DeepMind扔出个“大杀器”,GeminiRobotics1.5系列。
谷歌 推理 机器人 谷歌deepmind deepmind解 2025-09-28 18:15 5
最近,DeepSeek的AI团队在知名期刊《自然》上,以封面报道的形式刊发了DeepSeek-R1的科学原理。其中“老话”重提,再一次细细地讲解了大语言模型(LLMs)不必依赖人工示例或复杂指令,也能通过试错式强化学习,自主学会生成推理过程。
模型 学习 推理 黄仁勋 deepseek团队 2025-09-28 18:03 6
当所有人还在为参数内卷时,智能体真正的决胜点已经转向了速度与成本。浪潮信息用两款AI服务器直接给出了答案:一个将token生成速度干到10毫秒以内,一个把每百万token成本打到1元时代。
近日,谷歌推出其最先进的机器人具身推理模型——Gemini Robotics-ER 1.5。这是首个被广泛开放给所有开发者的Gemini机器人系列模型,它将作为机器人的高级推理大脑。
9月25日,谷歌DeepMind发布的Gemini Robotics 1.5系列,给机器人装上了真正会“思考”的大脑,这或许是通用AI走进物理世界的最关键一步。
一家由法国科学家组成的团队,开发出首个能够支持人工神经网络进行自适应本地训练和推理的混合存储器技术,从而突破了长期以来限制边缘AI(edge-AI)高效学习的技术瓶颈。
一个月前,我们曾报道过清华姚班校友、普林斯顿教授陈丹琦似乎加入 Thinking Machines Lab的消息。有些爆料认为她在休假一年后,会离开普林斯顿,全职加入 Thinking Machines Lab。
近日,谷歌正式发布其最先进的机器人具身推理模型——Gemini Robotics-ER 1.5,这一被定位为“机器人高级推理大脑”的视觉-语言模型(VLM),不仅是首个广泛开放给所有开发者的Gemini机器人系列模型,更被业界视为开启机器人现实世界互动能力新纪
家人们,《灼灼韶华》播到第30集啦,31、32集预告也放出!预告里,韶华因夏初的事怀疑知秋身份,知秋卖了上海的店去小地方开店,二妞不解,韶华却懂。很多观众怀疑知秋是叛徒,昨天就有网友来推理。原来夏初和知秋是革命战友,分工不同,配合默契。但反革命者使坏,给知秋假
在城市更新与文化传承的探索中,如何让灯光成为串联历史记忆与现代活力的纽带?广东巴菲照明以湖北武汉楚文化主题路灯灯光工程为实践载体,通过对灯光细节的极致打磨,让楚文化符号在光影里“活”起来,为城市夜景注入文化生命力与情感温度。
在人工智能发展的浪潮中,由Meta Superintelligence Labs的赵思言博士和陈飞宇博士领导的研究团队发表了一项突破性研究,论文题为"Inpainting-Guided Policy Optimization for Diffusion Lar
这项由蚂蚁集团杭州研发团队完成的突破性研究于2025年9月发表在计算语言学顶级会议上,论文题为《HANRAG: Heuristic Accurate Noise-resistant Retrieval-Augmented Generation for Mult
这项由浙江大学计算机科学与技术学院韩凯荣、赵文硕、赵子玉等研究者,以及华为诺亚方舟实验室叶俊剑、潘陆嘉等专家共同完成的研究,发表于2025年9月的arXiv预印本平台。有兴趣深入了解的读者可以通过论文标题"CAT: Causal Attention Tunin
蚂蚁百灵团队近日正式开源两款全新混合线性推理模型——Ring-mini-linear-2.0与Ring-flash-linear-2.0。相比前代,这一轮升级在延续高稀疏MoE结构的基础上,引入了混合线性注意力(Linear Attention)机制,专为长文
你给它一道题,它可能很快能找到一个能拿高分的解法。然后,它就会把这个解法焊在脑子里,以后碰到所有类似的题,翻来覆去就是这一招。这种现象,行话叫“模式崩溃”(mode collapse)。